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Die ROBERT BOSCH GMBH in Stuttgart/Deutschland hat eine 
Patentanmeldung unter der Bezeichnung 

"Verfahren zur Aufbereitung eines Datenstromes 
fiir die objektbasierte Codierung von Bewegt- 
bildf olgen" 

am 15. August 1997 beim Deutschen Patentamt eingereicht. 

Das angeheftete Stuck ist eine richtige und genaue Wieder- 
gabe der ursprtinglichen Unterlage dieser Patentanmeldung. 

Die Anmeldung hat im Deutschen Patentamt vorlaufig die Sym- 
bole H 04 N und G 06 T der Internationalen Patentklassif ika- 
t i on er ha 1 1 en . 
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Verfahren zur Auf bereitung ein es Datenstromes fur die 
Qbjektbasierte Codieruna von Beveatbildf olaen 

Stand der Technik 

Die Erfindung betrifft ein Verfahren zur Aufbereitung eines 
Datenstromes fur die obj ektbasierte Codierxang von 
Bewegtbildf olgen, die beliebige Form und GroSe aufweisen. 

Beim MPEG-4 Video Verification Model Version 7.0, Bristol, 
April 1997, MPEG-97/N 1642, ISO/IEC JTC/SC 29/WG 11 1st ein 
Encoder und Decoder zur obj ektbasierten Codierung von 
Bewegtbildf olgen spezif iziert . Dabei werden innerhalb einer 
Videosession (VS) nicht mehr rechteckige Bilder fester Grofie 
codiert und zum Empf anger ubertragen, sondern sogenannte 
Video Objects (VO) , welche beliebige Form und Gr6£e 
aufweisen durfen. Diese Videoobjekte konnen dann weiterhin 
noch in verschiedene Video Object Layer (VOL) unterteilt 
sein, urn z.B. verschiedene Auf losiingsstuf en eines 
Videoobjektes darzustellen. Die Abbildung eines VO eines 
bestimmten Layers in der Kamerabildebene zu einem bestimmten 
Zeitpunkt wird als Video Object Plane (VOP) bezeichnet . 
Somit ist die Beziehung zwischen VO und VOP aquivalent zu 
der Beziehung zwischen Bildfolge und Bild im Falle der 
Ubertragung rechteckiger Bilder fester GroSe. 
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Die Syntax zur Ubertragung eines VOP spezifiziert zum einen 
die Signal isierung der lokalen Zeitbasis eines VOP. Damit 
wird angegeben, zu welchem Zeitpunkt bezuglich bereits 
vorher ubertragener VOPs der aktuelle VOP zur Anzeige zu 
5 bringen ist. Diagramm 1 zeigt den Aufbau der Syntax fur die 

Elemente VS, VO, VOL und der relevanten Teile fur das 
Element VOP. 

Relevant in diesem Zusammenhang sind hier die dargestellten 
10 Teile der Syntax des VOP. Dabei gibt das Element „modulo 

time base" die lokale Zeitbasis des VOP in Schritten von 
1000 Millisekunden an, das Element „VOP time increment gibt 
zusatzlich die lokale Zeitbasis in Schritten von 1 
Millisekujide an. Das Element „VOP prediction type" gibt an, 
15 welche Art von Pradiktion fur den VOP verwendet werden soli. 

Hier gibt es vier Moglichkeiten : I-VOP, d.h. es wird keine 
Pradiktion verwendet, P-VOP, d.h. die Pradiktion wird aus 
dem zeitlich vorhergehenden VOP vorgenommen, B-VOP, d.h. die 
Pradiktion wird aus dem zeitlich vorhergehenden und dem 
20 zeitlich folgenden VOP vorgenommen sowie der Fall S-VOP, bei 

dem die Pradiktion aus einem sogenannten SPRITE-VOP 
vorgenommen wird, welcher entweder zu Beginn der Video- 
Session einmalig ubertragen Oder wahrend der Ubertragung aus 
den rekonstruierten Daten gewonnen wird. 

2': 

Zusatzlich zur Ubertragung der lokalen Zeitbasis eines VOP 
spezifiziert die Syntax eine Moglichkeit zur Signalisierung 
des Zustandes „ codiert/nicht codiert" fur ein VOP. Dabei 
werden fur den VOP im Falle des Zustandes „nicht codiert" 
3 0 nach den entsprechenden Signalisierungselementen keine 

weiteren Daten ubertragen und es wird die Ubertragung eines 
neuen VOP begonnen, sofern vorhanden. Auf der Empf angerseite 
wird ein „nicht codierter" VOP nicht weiter decodiert und 
nicht zur Anzeige gebracht . 
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Hierbei gibt das Element „ video object layer shape '\ welches 
im Bereich Headerlnfo der Syntax des zugehorigen VOL 
spezifiziert ist, an, ob es sich bei dem VO um ein 
rechteckiges VO (== O) oder um ein VO beliebiger Grofie und 
Form O) handelt. Fur den Fall eines VO beliebiger GroSe 
und Form wird dann mit Hilfe des Elementes „VOP width^^ die 
Breite des das VOP umgebenden Rechtecks angegeben. Ist diese 
Breite auf den Wert O gesetzt, so signalisiert dies, daE der 
VOP den Zustand „nicht codiert'^ hat. Es wird dann die 
Ubertragung der Daten des aktuellen VOP abgebrochen und mit 
der Ubertragung des nachsten VOP begonnen. 

Vorteile der Erfindung 

Mit den Mafinahmen der Erfindung ist es moglich weniger Daten 
fur ein nichtcodiertes Videoobjekts zu ubertragen, d.h. fur 
ein Videoobjekt, das nicht unmittelbar zur Anzeige zu 
bringen ist . Im Unterschied zum vorgenannten Stand der 
Technik ist die Verwendung eines eindeutigen Elements zur 
Signalisierung des Zustandes, ob ein Videoobjekt zur Anzeige 
zu bringen ist oder nicht einfacher und ubersichtlicher . 

Mit dem Verfahren nach der Erfindung ist es moglich, auch 
fur rechteckige VOs den Zustand codiert/nicht codiert zu 
ubertragen und somit zu signalisieren, was bei der 
Realisierung nach dem Stand der Technik nicht moglich ist. 

Die Signalisierungsinf ormation, die angibt, ob ein 
Videoobjekt codiert oder nicht codiert ist, kann der lokalen 
Zeitbasisinf ormation im Datenstrom vor- oder nachgestellt 
sein. Bei der Voranstellung der Signalisierungsinf ormation 
mussen fur einen nicht codierten VOP noch weniger Daten 
ubertragen werden als bei der Einfugung der 

Signalisierungsinf ormation nach der lokalen Zeitbasis, da in 
diesem Falle die lokale Zeitbasisinf ormation nicht 
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ubertragen wird. Allerdings ist in diesem Falle das 
„Ausblenden" , d.h. die Unterdruckung der Anzeige eines 
Videoobjektes, nicht mehr zu einem ganz speziellen Zeitpunkt 
moglich, sondern nur noch zu dem auf den Empfang des nicht 
5 codierten VOPs nachstf olgenden Zeitpunkt, zu dem beim 

Empf anger ein Bild zur Anzeige gebracht wird. 

Beschreibung von Ausfuhrungsbei spiel en 

10 In Diagramm 2 ist der Aufbau des Datenstromes fur die 

Ubertragung von Videoobjekten dargestellt. Zu Beginn (erste 
Zeile des Diagramms) wird das Element „ video session start 
code" ubertragen und anschlieSend die Inf ormationen fur die 
Videoobjekte 1, 2 n. Am SchluS erscheint der „ video 

15 session end code". In der zweiten Zeile ist der Aufbau des 

Ubertragungs formates fur das „ video object 1" dargestellt. 
Es beginnt mit dem video object start code" gefolgt von der 

video object identification" und den Elementen fur die 
„ video object layers" 1 bis n. Ein einzelnes Element „ video . 

20 object layer" ist in seinem Aufbau in der dritten Zeile 

dargestellt. Es beginnt mit dem „video object layer start 
code" gefolgt von der „video object layer identification", 
dem „HeaderInfo" und den Elementen 1 bis n, fur die „Video 
Object Plane". In der vierten Zeile ist der Aufbau eines 

2[ Einzelelementes „Video Object Plane" dargestellt. Es beginnt 

mit dem „VOP start code", gefolgt von der lokalen 
Zeitbasisinf ormation „modulo time base" und dem Element 
„modulo time increment " .Dieser Aufbau stimmt soweit mit dem 
Aufbau gemaS Diagramm 1 uberein. In Abweichung zu Diagramm 1 

3 0 wird aber nun erf indungsgemaS stets ein neues Element in 

Form einer Signalisierungsinf ormation in den Datenstrom 
eingefugt, das angibt, ob das Videoobjekt fur die Wiedergabe 
zu decodieren beziehungsweise zur Anzeige zu bringen ist. 
Die Einfugung der Signalisierungsinf ormation erfolgt auch 

3 5 unabhangig von der au£eren From eines Videoobjektes . Diese 
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Signalisierungsinf ormation besteht aus dem Element „VOP 
coded"' und ist so definiert, daS der Wert O den Zustand 
„nicht codiert" und der Wert 1 den Zustand „codiert" 
signalisiert . Fur den Empf anger ist dabei zu definieren, daE 
5 das entsprechende VO fur den Fall „VOP coded == zum 

Zeitpunkt, der durch die lokale Zeitbasis angegeben wird 
Oder zum nachsten darauf f olgenden Zeitpunkt, zu dem beim 
Empfanger ein Bild zur Anzeige gebracht wird, nicht mehr 
angezeigt wird. Die Signalisierung mittels des Elementes 
10 ,/VOP width" wird im Gegensatz zur Realisierung gemaS 

Diagramm 1 nicht mehr durchgef uhrt . 

Das Element "VOP coded" kann auch nach dem Element "VOP 
prediction type" in den Datenstrom eingefugt werden. 

15 In Diagramm 3 ist ein weiteres Ausf uhrungsbeispiels der 

Erfindung dargestellt. Die Signalisierungsinf ormation „VOP 
coded" wird nuxi direkt nach dem Element „VOP start code" 
plaziert, d.h. vor der lokalen Zeitbasisinf ormation „modulo 
time base". Auch fur dieses Ausf uhrungsbeispiel wird die 

2 0 Signalisierung mittels des Elementes „VOP width" nicht mehr 

durchgef uhrt . Im Unterschied zum ersten Ausf uhrungsbeispiel 
(Diagramm 2) mussen fur einen nicht codierten VOP noch 
weniger Daten ubertragen werden, da die lokale Zeitbasis 
nicht zu ubertragen werden braucht . Allerdings ist in diesem 

21 Falle das „Ausblenden" , d.h. das nicht mehr zur Anzeige 

bringen eines VOs , nicht mehr zu einem ganz speziellen 
Zeitpunkt moglich, sondem nur noch zum auf den Empfang des 
„nicht codierten" VOPs nachstf olgenden Zeitpunkt, zu dem 
beim Empfanger ein Bild zur Anzeige gebracht wird. 
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Anspruche 

10 1. Verfahren zur Aufbereitung eines Datenstromes fur die 

ob jektbasierte Codienmg von Bewegtbildf olgen fur 
Videoobjekte , die beliebige Form und GroSe aufweisen, mit 
f olgenden Schritten : 

15 - Der eigentlichen Information uber das Videoobjekt wird 

eine lokale Zeitbasisinf ormation vorangestellt , 

vor Oder nach dieser Zeitbasisinf ormation wird unabhangig 
von der auSeren Form eines Videoobj ektes stets eine 
20 Signalisierungsinf ormation in den Datenstrom eingefugt, die 

angibt, ob das Videoobjekt fur eine Wiedergabe zu decodieren 
beziehungsweise zur Anzeige zu bringen ist. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , da£ 
21. die Signalisierungsinf ormation zwei Zustande fur ein 

Videoobjekt angibt, namlich den Zustand codiert und nicht 
codiert; wobei fur den Zustand nicht codiert die Ubertragung 
der Information uber das Videoobjekt abgebrochen wird und 
die Anzeige fur dieses Videoobjekt unterdruckt wird. 


30 


3 . Verfahren nach Anspruch 1 oder 2 , dadurch 
gekennzeichnet, daE fur Videoobjekte, deren 
Signalisierungsinf ormation dem Zustand nicht codiert 
entspricht, das entsprechende Videoobjekt zu einem 



Zeitpunkt, der durch die lokale Zeitbasisinf ormation 
bestimmt ist, nicht mehr zur Anzeige gebracht wird. 

4. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet , 
5 daS fur Videoobjekte , deren Signalisierungsinf ormation dem 

Zustand nicht codiert entspricht, das entsprechende 
Videoobjekt zu dem auf den Zeitpiinkt, der durch die lokale 
Zeitbasisinf ormation bestimmt ist, nachstf olgenden Zeitpunkt 
zu dem eine Anzeige erfolgen sollte, nicht mehr zur Anzeige 
10 gebracht wird. 
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Vgrfah ren zur Auf bereitima eines Datenstromes fur die 
10 objektba sierte Codieruna von Bewecrtbildf olaen 

Zusammenf assung 

Fur die ob j ektbasierte Codierung von Bewegtbildf olgen fur 
15 Videoobjekte wird unabhangig von der auSeren Form eines 

Videoobjektes stets eine Signalisierungsinf ormation 
ubertragen, die angibt, ob das Videoobjekt fur eine 
Wiedergabe zu decodieren bezieh\ingsweise zur Anzeige zu 
bringen ist. 
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Im Gegensatz zu einer bisherigen Losung mussen weniger Daten 
ubertragen werden. 


